pacman::p_load(tidyverse, palmerpenguins, fstatix,
ggtext)
ggplot(data = mtcars, aes(x = hp, y = mpg)) +
geom_point()CE II: Visualização de dados
DEPAT/IPE-DF
O que é
É a representação de dados para facilitar a interpretação.
Área interdisciplinar:
Porque fazer
Tornar análise de dados mais acessível.
Difíceis de automatizar: dificilmente ficará obsoleta.
DataViz, para os íntimos
Para que serve
Como fazer
Nem sempre os números funcionam …
Fazer uso de outros elementos
Análise Exploratória
É um trabalho de investigação de dados
A ferramenta: precisa ser rápida/fácil
O objetivo é aprender
Análise descritiva
É um trabalho de otimização visual
A ferramenta: precisa ser customizável
O objetivo é comunicar
Exploratória
Dar sentido em todas as informações
Trabalho de detetive
Ajuda a levantar hipóteses
EDA (Exploratory Data Analysis)
Aprimorar a visualização pata melhorar a comunicação.
Cores, fontes, elementos geométricos, entre outros, a partir de um gráfico exploratório.
Não é uma ciência exata.
Geometrias
Cores
Eixos
Formas
Tamanhos
Posicionamento
Gráficos ruins.
Gráficos “mentirosos”.
Gráficos mal feitos ou pouco eficientes.
Gráficos a se evitar
Gráficos para tomar cuidado
Conhecer suas variáveis.
Numéricas/Quantitativas: contínuas e discretas
Categóricas/Qualitativas: Nominais e Ordinais
RGB (Red, Green, Blue)/ Hexadecimal
HSL (Hue, Saturation, Lightness)
Paletas de cores prontas
Escalas qualitativas: utilizado para variáveis nominais (sexo, cor/raça)
Escalas divergentes: utilizado para variáveis que têm um centro neutro (favorável/neutro/desfavorável, correlação)
Escalas sequenciais: utilizado para variáveis ordinais (faixa etária, renda)
Uma propriedade visual pré-atentativa é processada pelo nosso cérebro antes de uma ação consciente.
Como isso esse processamento é muito rápido, trata-se de uma oportunidade para tornar visualizações mais amigáveis e diretamente interpretadas.
. . .
. . .